تشخیص هوشمند و خودکار غلط های تایپی در پایگاه داده های بزرگ بدون استفاده از لغت نامه
Authors
abstract
غلط های تایپی یکی از مشکلات مهم در سیستم های کامپیوتری و سیستم های پایگاه داده ای است. وجود غلط های تایپی در پایگاه داده ها نه تنها از نظر صحت پایگاه داده مشکل ساز هستند، بلکه باعث می شوند به هنگام ضرورت نتوان رکورد واردشده را بازیابی کرد. همین امر گاه باعث می شود که کاربر مجدداً همان رکورد را وارد پایگاه داده نماید که منجر به وجود آمدن افزونگی می گردد. روش های موجود تشخیص غلط ها، مبتنی بر لغت نامه هستند. بدین معنی که از یک لغت نامه بزرگ که همه لغات آن صحیح فرض می شوند استفاده می کنند و اگر کلمه ای در لغت نامه نباشد به عنوان غلط تایپی شناخته می شود. تهیه لغت نامه ای بزرگ و با دقت بالا بسیار پرهزینه و زمان بر است. به علاوه چنین لغت نامه ای مختص یک زمینه خاص (مثلاً محیط پزشکی) است و قابل استفاده و در زمینه های دیگر (مثلاً جامعه شناسی) نیست. در این مقاله روشی ارائه می شود که بدون نیاز به لغت نامه می تواند غلط های تایپی را تشخیص دهد. روش پیشنهادی با چند معیار مرسوم ارزیابی شده است. نتایج آزمایش ها نشان دهنده دقت 93.5 درصدی برای این روش است. علاوه بر دقت بالای روش پیشنهادی، عدم نیاز به لغت نامه یک ویژگی منحصر به فرد برای آن به شمار می رود.
similar resources
تشخیص هوشمند و خودکار غلطهای تایپی در پایگاهدادههای بزرگ بدون استفاده از لغتنامه
غلطهای تایپی یکی از مشکلات مهم در سیستمهای کامپیوتری و سیستمهای پایگاهدادهای است. وجود غلطهای تایپی در پایگاهدادهها نه تنها از نظر صحت پایگاهداده مشکلساز هستند، بلکه باعث میشوند به هنگام ضرورت نتوان رکورد واردشده را بازیابی کرد. همین امر گاه باعث میشود که کاربر مجدداً همان رکورد را وارد پایگاهداده نماید که منجر به وجود آمدن افزونگی میگردد. روشهای موجود تشخیص غلطها، مبتنی بر لغتن...
full textتصحیح خودکار غلط های تایپی فارسی به کمک شبکه عصبی مصنوعی ترکیبی
Automatic correction of typos in the typed texts is one of the goals of research in artificial intelligence, data mining and natural language processing. Most of the existing methods are based on searching in dictionaries and determining the similarity of the dictionary entries and the given word. This paper presents the design, implementation, and evaluation of a Farsi typo correction system u...
full textیک پایگاه داده به منظور استفاده در سامانه هوشمند تشخیص شخصیت
گرافولوژی ، علم مطالعه و بررسی شخصیت و خصوصیات فردی بر اساس نوشتن است. آگاهی از این علم میتواند موارد استفاده زیادی در جامعه داشته باشد. در این مقاله، یک پایگاه داده دست نوشته های فارسی برای گرافولوژی و تشخیص هوشمند شخصیت معرفی میشود. داده های جمع آوری شده شامل 140 نمونه دستخط از دو گروه دانشجویان دانشگاه جامع علمی کاربردی و مددجویان زندان شهر سمنان میباشد. ضمن اخذ دستخط، افراد شرکت کننده در ا...
full textالگوریتم های هوشمند تطابق چهره در پایگاه داده های بزرگ
تطابق چهره بصورت خودکار یکی از کارهای چالش برانگیزی است که در دهمه اخیر توجه زیادی را به خود جلب کرده است. الگوریتم های مختلفی برای تطابق چهره وجود دارند. کارایی این الگوریتم ها روی پایگاه داده های مختلف آزمایش شده است. برای اینکه این الگوریتم ها قابل پیاده سازی و استفاده باشند، باید بتوان از آنها روی پایگاه داده های بززگ استفاده کرد. هنگام اجرا روی پایگاه داده های بزرگ علاوه بر کارایی، زمان اج...
15 صفحه اولتصحیح خودکار غلط های تایپی فارسی به کمک شبکه عصبی مصنوعی ترکیبی
ارایه راهی برای تصحیح غلط های املایی نگاشته شده توسط انسان یکی از اهداف مورد توجه در دانش هوش مصنوعی، متن کاوی و پردازش زبان طبیعی است. بیشتر روش های موجود برای تصحیح غلط های املایی بر پایه الگوریتم های جست وجو در فرهنگ واژگان و تعیین نسبت شباهت واژگان درست موجود در فرهنگ واژگان با واژه نادرست مورد نظر کار می کنند. در این پژوهش طراحی، پیاده سازی و ارزیابی یک مصحح املایی به کمک شبکه های عصبی مصن...
full textنارسایی های لغت نامه های روسی به فارسی چاپ ایران
با توجه به اهمیت فرهنگ نویسی، در یک فعالیت تحقیقی فشرده بر آن بوده ایم، وضعیت لغت نامه های روسی- فارسی را بررسی و رویهء استاندارد مناسبی برای تجدید نظر در جهت أرتقاء آن ها جستجو و معرفی کنیم، بررسی های ما نشان می دهد که در لغت نامه های روسی- فارسی , نواقص متعدإی وجودد ارد. اهمیت لغت نامه های تشریحی، دو زبانه، بسامدی، دستوری و متنی در آن است که این ها به عنوان منابع بنیادین، مصالح أولیهء فعال...
full textMy Resources
Save resource for easier access later
Journal title:
مهندسی برق دانشگاه تبریزجلد ۴۷، شماره ۱، صفحات ۸۱-۹۱
Keywords
Hosted on Doprax cloud platform doprax.com
copyright © 2015-2023